온톨로지, 피지컬 AI, 인과 추론의 융합과 미래

온톨로지, 피지컬 AI, 인과 추론의 융합과 미래

2025-11-07, G25DR

1. 서론: 지식, 행동, 그리고 원인 - 차세대 AI의 세 가지 기둥

현대 인공지능(AI)은 방대한 데이터에서 놀라운 패턴을 학습하지만, 종종 ’허위 상관관계(spurious correlation)’의 함정에 빠져 강인성(robustness)과 일반화(generalization)에 한계를 보인다.1 AI가 단순한 패턴 매칭을 넘어 ’이해’에 기반한 추론을 하기 위해서는 세 가지 핵심 전략의 융합이 필요하다. 이는 (1) 지식의 명시적, 구조적 표현(온톨로지 및 지식 그래프), (2) 물리적 세계와의 상호작용을 통한 학습(피지컬 AI), 그리고 (3) ’왜’라는 질문에 답하는 능력(인과 추론)이다.

본 보고서는 이 세 가지 축이 독립적으로, 그리고 상호작용하며 어떻게 차세대 AI를 구축하는지 심층적으로 분석한다. 지식 그래프가 ’무엇’이 존재하는지에 대한 사실을 제공한다면, 피지컬 AI는 ‘어떻게’ 행동하며 데이터를 수집하는지를, 그리고 인과 추론은 그 행동의 ’이유’와 ’결과’를 이해하는 프레임워크를 제공한다. 본 보고서는 각 분야의 핵심적인 구체적 적용 사례를 분석하고, 이들이 어떻게 융합되어 더 강인하고 설명 가능한 AI 시스템으로 나아가는지 논의한다.

2. 지식의 공식화 - 온톨로지(Ontology)와 지식 그래프(Knowledge Graph)

AI가 데이터를 ’이해’하기 위한 첫 번째 단계는 지식을 기계가 처리할 수 있도록 공식화하는 것이다. 이 장에서는 지식 표현의 두 가지 핵심 요소인 온톨로지(의미의 청사진)와 지식 그래프(사실의 연결망)의 기술적 정의와 구체적인 산업 적용 사례를 분석한다.

2.1 온톨로지: 의미의 청사진 (The Blueprint of Meaning)

기술적 정의 (W3C 표준)

온톨로지는 단순히 용어를 계층적으로 분류하는 ’분류 체계(taxonomy)’가 아니다. 이는 특정 도메인의 ’사물, 사물의 그룹, 사물 간의 관계’에 대한 풍부하고 복잡한 지식을 표현하기 위해 설계된 정형화된 ’시맨틱 웹 언어’이다.2 W3C의 핵심 표준인 OWL(Web Ontology Language)은 RDF(Resource Description Framework) 및 RDFS(RDF Schema)와 같은 기술 스택을 기반으로 한다.5 온톨로지의 궁극적인 목적은 정보에 명시적인 ’의미(semantics)’를 부여하여, 기계가 데이터를 단순히 저장하는 것을 넘어 ’자동으로 처리하고 통합’할 수 있게 만드는 것이다.5

이러한 내장된 시맨틱스(embedded semantics)는 데이터에 대한 ’추론(reasoning)’을 가능하게 한다.5 즉, 온톨로지의 핵심 가치는 용어를 ’저장’하는 데 있는 것이 아니라, 저장된 지식(공리, axiom)을 기반으로 명시되지 않은 새로운 사실을 ’논리적으로 추론’해내는 능력에 있다. 예를 들어, 온톨로지에 (A는 B의 하위 클래스이다)(B와 C는 상호 배타적이다)라고 정의되어 있다면, 시스템은 (A는 C와 상호 배타적이다)라는 새로운 지식을 자동으로 추론할 수 있다. 이는 지식 그래프의 단순한 사실 검색을 뛰어넘는 능력이다.

[사례 1] 생명 정보학: 유전자 온톨로지 (Gene Ontology, GO)

유전자 온톨로지(GO)는 온톨로지의 강력한 과학적 적용 사례이다. GO 컨소시엄의 임무는 단백질과 같은 유전자 산물의 기능에 대한 ’포괄적이고 계산 가능한 모델’을 제공하는 것이다.7

  • 구조: GO는 (1) 유전자 기능의 논리적 구조와 관계를 정의하는 ‘온톨로지’ 자체와, (2) 특정 유전자 산물을 온톨로지 용어와 연결하는 과학적 ’증거 기반 진술(annotations)’의 두 부분으로 구성된다.7 이 지식은 ‘분자 기능(Molecular Function)’, ‘생물학적 과정(Biological Process)’, ’세포 구성요소(Cellular Component)’라는 세 가지 하위 도메인으로 체계화된다.7

  • 핵심 적용: GO의 가장 일반적인 용도는 ’유전자 농축 분석(GO Enrichment Analysis)’이다.10 예를 들어, 특정 암세포에서 발현이 증가한 100개의 유전자 목록을 얻었을 때, 이 분석은 해당 유전자 목록이 GO의 특정 ‘생물학적 과정’ 용어(예: ‘세포 주기 조절’)에 통계적으로 유의미하게 편중되어 있는지(over-represented) 계산한다.

이는 온톨로지가 ’데이터’를 ’지식’으로 변환하는 ‘의미론적 렌즈(semantic lens)’ 역할을 수행함을 보여준다. 연구자가 얻은 ’발현이 증가한 유전자 목록’은 그 자체로는 원시 데이터(raw data)에 불과하다. 이 데이터에 GO라는 ‘계산 가능한 모델’ 7을 적용할 때, 비로소 “이 유전자들은 ‘면역 반응’ 경로와 강하게 연관되어 있다“는 실행 가능한 ’지식’이 도출된다.10 즉, 온톨로지는 원시 데이터에 생물학적 ’의미’와 ’맥락’을 부여하는 핵심적인 해석 프레임워크이다.

[사례 2] 엔터프라이즈 지식 관리 (Enterprise Knowledge Management, EKM)

기업 환경에서 온톨로지는 분산된 지식을 통합하는 데 사용된다. 한 글로벌 자동차 제조사는 여러 차례의 지식 관리(KM) 이니셔티브 실패 후, Enterprise Knowledge (EK)사와 협력하여 새로운 ’지식 관리 시스템(KMS)’을 구축했다.11

  • 목표: 이 프로젝트의 핵심 목표는 ’정보 접근성을 간소화’하고 ’전문가의 제도적 지식(institutional knowledge)’을 더 잘 활용하는 것이었다.11

  • 해결책: ‘시맨틱 레이어(semantic layer)’ 기술 아키텍처의 핵심 구성 요소로 ’온톨로지’를 도입했다.11 이는 조직 전체에 흩어진 ’분산된 데이터 소스(disparate data sources)’를 통합하고, 데이터를 ’연결된, 맥락화된, 지능적인 지식 생태계’로 전환한다.11 IBM 역시 유사한 목적으로 ’Enterprise Ontology’를 구축하여 ’활동, 조직, 전략, 마케팅’과 관련된 핵심 비즈니스 용어와 정의를 공식화했다.12

이 접근 방식은 조직의 ’암묵지(tacit knowledge)’를 ’형식지(explicit knowledge)’로 전환하고, ’개념 기반 검색(concept-based search)’을 가능하게 한다. 기업의 고질적인 문제는 ’정보 사일로’와 전문가 개인에게 체화된 ’암묵지’이다.11 온톨로지는 ‘공유된 언어(shared language)’ 11와 명확한 ‘용어 정의’ 12를 제공함으로써, 서로 다른 부서의 데이터를 ’키워드’가 아닌 ‘개념’ 수준에서 연결한다. 예를 들어, ’엔진 결함 분석’이라는 키워드 검색은 해당 단어가 포함된 문서만 찾는다. 하지만 온톨로지 기반의 시맨틱 검색은 ’엔진 결함’의 하위 개념(예: ‘피스톤 균열’, ‘터보차저 고장’)이나 관련 전문가(해당 주제의 보고서를 작성한 엔지니어)까지 모두 ’추론’하여 제공할 수 있다.

2.2 지식 그래프: 거대 규모의 사실 연결망 (The Web of Facts at Scale)

기술적 정의

온톨로지가 도메인의 ’클래스’와 ‘속성’(즉, 스키마)을 정의한다면, 지식 그래프(KG)는 이러한 스키마를 따르는 ’개체(entity)’와 ’관계(relationship)’의 대규모 ‘인스턴스’ 집합이다. 지식 그래프는 (노드, 엣지, 노드) 또는 (주체, 술어, 객체) 형태의 ’사실(Fact)’들을 저장하는 거대하고 연결된 데이터베이스이다.13

[사례 3] Google 지식 그래프와 검색의 진화

가장 잘 알려진 지식 그래프는 Google의 검색 엔진에 탑재된 시스템이다.

  • 규모: Google의 지식 그래프는 “50억 개의 개체(entities)에 대한 5000억 개 이상의 사실(facts)“을 축적한 방대한 데이터베이스이다.14

  • 구축: 이는 Wikipedia, CIA World Factbook과 같은 공개 소스 14뿐만 아니라 음악, 스포츠 등에 대한 라이선스 데이터를 통합하여 구축된다.14

  • 핵심 적용: ‘지식 패널(Knowledge Panels)’.14 사용자가 “에펠탑 높이“와 같은 사실적 질문을 검색했을 때 16, Google은 관련 웹페이지 링크 목록을 제공하는 대신, “300 미터“라는 구조화된 ’답변’을 지식 패널 형태로 직접 제공한다.14

이는 전통적인 ’문서의 웹(Web of Documents)’이 ’데이터의 웹(Web of Data)’으로 전환되는 과정을 보여준다. 전통적인 검색 엔진은 키워드와 일치하는 ’문서’를 반환한다. 반면, 지식 그래프는 ‘개체’(예: 에펠탑)와 그 ‘속성’(예: 높이=300m)을 직접 연결한다.13 사용자의 쿼리가 개체와 관계에 대한 질문으로 해석될 때, Google은 웹페이지를 찾는 대신 자사의 지식 그래프 16를 직접 ’질의(query)’한다. 지식 패널 14은 이 질의의 ’결과’이며, 이는 기계가 데이터의 ’의미’를 이해하고 직접 처리하는 5 시맨틱 웹의 비전이 상업적으로 가장 성공한 사례이다.

[사례 4] Amazon의 제품 추천과 AutoKnow

전자상거래 분야에서 지식 그래프는 추천 시스템의 핵심이다. Amazon은 제품 추천의 정확도를 높이기 위해 제품 지식 그래프와 그래프 신경망(GNN)을 결합하여 사용한다.17

  • 그래프 구성: 제품(노드)들은 ‘함께 구매(co-purchase)’ (방향성 엣지) 또는 ‘함께 본(co-view)’ (양방향 엣지) 관계(엣지)로 연결된다.17

  • GNN 적용: 이 그래프에서 GNN은 제품 간의 비대칭적 관계(예: ‘카메라’ 구매자는 ’렌즈’를 함께 구매하지만, ‘렌즈’ 구매자가 ’카메라’를 함께 구매하는 경우는 적음)를 학습하기 위해 ’소스 임베딩’과 ’타겟 임베딩’을 분리하여 사용한다.17

  • KG 구축 자동화 (AutoKnow): 수백만 개의 제품으로 구성된 이 그래프를 수동으로 구축하는 것은 불가능하다.18 Amazon은 ’AutoKnow’라는 자동화 시스템을 개발했다. AutoKnow는 (1) 기존 제품 분류 체계(taxonomy), (2) 사용자 로그, (3) 제품 카탈로그의 ‘자유 형식 텍스트’(예: 제품명, 설명, 고객 리뷰)를 입력받는다.18 그리고 기계 학습 모델을 사용해 이 텍스트에서 ‘제품 유형’(예: “ice cream”)과 ‘속성’(예: “black cherry cheesecake“는 “flavor”)을 자동으로 추출하여 지식 그래프를 지속적으로 구축하고 강화한다.18

AutoKnow 시스템은 비정형(neural) 처리와 정형(symbolic) 구조화를 결합한 ’지식 추출의 선순환(virtuous cycle)’을 보여주는 핵심적인 뉴로-심볼릭(Neuro-Symbolic) 하이브리드 사례이다. 이 과정은 다음과 같다: (1) AutoKnow의 ML 모델(Neural)이 비정형 텍스트 18를 파싱하여 (2) 정형화된 ‘사실’(Symbolic)을 추출한다.18 (3) 이 사실들은 제품 지식 그래프(Symbolic)에 주입(infuse)된다. (4) 이후, Amazon의 추천 시스템은 이 구조화된 지식 그래프를 입력으로 받아 GNN(Neural)을 다시 훈련시킨다.17 이는 (Neural \rightarrow Symbolic \rightarrow Neural)로 이어지는 강력한 구조로, 비정형 데이터(텍스트)로 정형 지식(KG)을 만들고, 이 정형 지식(KG)을 다시 비정형 학습(GNN)의 입력으로 사용해 비즈니스 가치(추천)를 창출한다.

[사례 5] LinkedIn의 전문 인재 네트워크 (LKG)

LinkedIn Knowledge Graph (LKG)는 ’전문가 세계’의 온톨로지(개념)와 개체(8억 1천만 명의 사용자, 5700만 개의 기업 등)를 정의한다.19

  • 핵심 적용: ‘People You May Know’ (알 수도 있는 사람) 추천 21 및 직무 추천.

  • 추론 방식 (Link Prediction): LKG의 진정한 가치는 명시적으로 ’저장된 사실’이 아니라 ’추론된 잠재적 사실’에 있다. LinkedIn은 ’지도 학습 분류기(supervised classifier)’를 사용하여 <회원, 기술> 쌍의 관계가 존재할 확률을 예측(추론)한다.22

  • 활용 피처: 이 분류기는 회원의 프로필(예: 직함)과 그들의 전문적 네트워크(예: 연결된 동료들이 보유한 기술)에서 추출한 피처를 사용한다.22

예를 들어, 특정 사용자가 자신의 프로필에 ‘Python’ 기술을 명시하지 않았더라도, (a) 그들의 직함이 ’데이터 과학자’이고 (b) ‘Python’ 기술을 보유한 동료들과 많이 연결되어 있다면, LKG의 분류기는 이 사용자가 ’Python 보유’라는 ’잠재적 엣지(간선)’를 가질 확률이 높다고 추론한다.22 이 ’추론된 엣지’는 즉시 이 사용자에게 ‘Python 개발자’ 직무를 추천하는 데 사용된다.21 즉, 지식 그래프는 정적인 데이터베이스가 아니라, GNN 또는 분류기 22와 결합하여 끊임없이 새로운 관계를 예측하는 ’동적 추론 엔진’으로 작동한다.

3. 세계와의 상호작용 - 피지컬 AI (Physical AI)

’정보 AI(Informational AI)’가 데이터 처리와 분석에 중점을 둔다면 23, ‘피지컬 AI(Physical AI)’ 또는 ’체화된 AI(Embodied AI)’는 AI가 물리적 실체(body)를 가지고 현실 세계와 상호작용하며 학습하는 패러다임이다.

3.1 정보 AI를 넘어 체화된 AI로

개념 정의

’정보 AI’는 주로 데이터를 ’처리’하고 ’분석’한다. 텍스트를 처리하는 대규모 언어 모델(LLM)이나 이미지를 분류하는 CNN이 이에 해당한다.23 반면, ’피지컬 AI’는 AI가 ‘물리적 시스템’(예: 로봇, 자율주행차, 공장 설비)에 ’통합(integration)’되어, ‘센서’(카메라, 마이크 등)를 통해 현실 세계를 ’인식(perceive)’하고, ’추론(reason)’하며, ’행동(act)’하는 AI를 의미한다.23

학습 방식의 근본적 차이

정보 AI는 대부분 정적인(static) 데이터셋을 기반으로 학습한다. 하지만 피지컬 AI는 ’시행착오(trial-and-error)’와 ’직접적인 경험 및 피드백’을 통해 학습한다.24

’체화(Embodiment)’는 AI의 학습 루프(learning loop)를 근본적으로 바꾼다. 정보 AI의 학습 루프가 (Data \rightarrow Model \rightarrow Output)이라면, 피지컬 AI의 학습 루프는 (Perceive \rightarrow Reason \rightarrow Act \rightarrow Observe Consequence \rightarrow Update Model \rightarrow Perceive \dots)라는 ’폐쇄 루프(closed loop)’이다.24 이 ‘행동-관찰’ 루프는 정보 AI가 접근할 수 없는 새로운 유형의 데이터, 즉 ’나의 행동이 세상에 어떤 변화를 일으키는가?’에 대한 데이터를 생성한다. DeepMind의 Gemini Robotics가 물리적 환경에서 논리적 결정을 내리고 행동하는 것 25이 바로 이 원리이다.

3.2 피지컬 AI 적용 사례 분석

[사례 6] 로보틱스: 낯선 물체 잡기 (Berkeley Dex-Net)

로보틱스 분야의 고전적인 난제는 로봇이 ‘낯선 물체(novel objects)’, 즉 훈련 데이터에서 한 번도 보지 못했던 다양한 형태의 물체를 안정적으로 잡는 것이다.26 실제 로봇으로 수백만 번의 잡기를 시도하며 데이터를 수집하는 것은 물리적으로 불가능하다.

  • 해결책 (Dex-Net): UC 버클리의 Dex-Net 프로젝트는 이 문제를 ’시뮬레이션’을 통해 해결한다.
  1. 합성 데이터셋 (Synthetic Datasets): 3D 객체 모델과 물리 엔진을 사용하여, 5백만 개(Dex-Net 4.0)에서 6.7백만 개(Dex-Net 2.0)에 달하는 방대한 양의 ‘합성’ 그랩(grasp) 데이터셋을 생성한다.27

  2. 도메인 무작위화 (Domain Randomization): 시뮬레이션 환경의 조명, 질감, 물체의 물리적 특성(예: 마찰력)을 의도적으로 ‘무작위로’ 변경한다.27

  3. 학습: 이 무작위화된 합성 데이터로 ‘Grasp Quality CNN (GQ-CNN)’ 26이라는 정책을 훈련시켜, 특정 그랩이 성공할 확률을 예측하게 한다.

  • 결과: 놀랍게도 오직 ’합성 데이터’로만 훈련된 이 정책이, 실제 로봇 환경에서 처음 보는 ’낯선 물체’들을 95% 이상의 높은 신뢰도로 집어 올리는 데 성공했다.27

’도메인 무작위화’는 AI가 ’현실의 본질적 물리 법칙’과 ’시뮬레이션의 우연적 특징’을 분리하도록 강제하는 강력한 학습 기법이다. 시뮬레이션(Sim)과 현실(Real) 사이에는 항상 ’차이(Gap)’가 존재한다. 시뮬레이션을 현실과 똑같이 만들려고(photorealistic) 노력하면, AI는 ’현실’이 아닌 ’시뮬레이션의 특정 질감’과 같은 ’허위 상관관계’에 과적합(overfit)될 수 있다. ‘도메인 무작위화’ 27는 이 접근법을 뒤집어, 시뮬레이션을 비현실적이고 혼란스럽게 만든다(예: 무지개색 조명). 이 혼돈 속에서 AI가 ’성공적인 잡기’라는 일관된 보상을 얻기 위해서는, ’질감’이나 ’조명’처럼 무작위로 변하는 (비본질적인) 특징을 ’무시’하고, 잡기의 ‘기하학적/물리적 본질’(예: 두 지점 사이의 안정적인 접촉)이라는 ’강인한(robust) 특징’만을 학습해야 한다. 즉, AI는 시뮬레이션의 수많은 ’교란 변수(confounders)’를 뚫고 ’성공적인 잡기’의 ’진짜 원인’을 학습하게 된다.

[사례 7] 자율주행: 엣지 케이스(Edge Case) 대응

자율주행 시스템(ADS)의 안전성은 99.9%의 ’정상 주행(nominal driving)’이 아니라, 0.1%의 예측 불가능한 ‘엣지 케이스’(예: 갑자기 도로로 뛰어드는 보행자, 폭우로 인해 지워진 차선)에 의해 결정된다.29

  • 해결책 (NHTSA 프레임워크): 미국 도로교통안전국(NHTSA)은 ADS를 체계적으로 테스트하기 위한 ’테스트 가능한 사례 및 시나리오 프레임워크’를 개발했다.29

  • 테스트 매트릭스: 이 프레임워크는 (1) ODD (운영 설계 도메인, 예: 날씨, 도로 유형), (2) OEDR (객체 및 이벤트 감지/대응, 예: 보행자 감지), (3) 고장 모드 (예: 센서 고장)의 조합으로 ’테스트 시나리오’를 정의한다.29

  • 접근법: ’엣지 케이스’를 효과적으로 테스트하기 위해, 시뮬레이션, 폐쇄 트랙, 그리고 실제 도로 테스트를 혼합하여 ’정상 주행, 잠재적 엣지 케이스, 충돌 회피 상황’을 종합적으로 테스트한다.30

이는 ‘엣지 케이스’ 테스트가 단순한 ’관찰’에서 ’구조적 개입’으로의 전환을 의미함을 보여준다. ’100만 마일 무사고 주행’은 ’관찰(Seeing)’에 기반한 접근법이다. 이는 극히 드물게 발생하는 엣지 케이스 29를 접하는 데 매우 비효율적이다. 반면, NHTSA의 프레임워크 29는 ’무엇이 잘못될 수 있는가?’라는 질문에 답하는 ‘개입(Doing)’ 기반의 접근법이다. (ODD=폭우) + (OEDR=부분적으로 가려진 보행자) + (Failure Mode=카메라 지연)과 같은 시나리오를 ‘의도적으로’ 구성 30하는 것은, 시스템의 한계를 테스트하기 위한 ’체계적인 개입’이다.

[사례 8] 스마트 팩토리: 예지 보전 (Siemens Amberg)

지멘스의 암베르크(Amberg) 전자 공장은 ’AI 기반 스마트 팩토리’의 대표 사례이며, 99.9%의 생산 품질을 달성한다.31

  • 핵심 기술:
  1. AI 기반 예측 정비: 10,000대 이상의 기계에서 수집된 진동, 온도, 음향 센서 데이터를 기계 학습 알고리즘으로 분석하여 31, ’예기치 않은 가동 중단(unplanned downtime)’을 30% 줄인다.31

  2. 디지털 트윈 (Digital Twin): 물리적 공장의 ’가상 모델’을 실시간으로 구축한다.31 엔지니어는 실제 생산 라인을 멈추지 않고도 디지털 트윈 상에서 수천 가지의 ’what-if 시나리오’를 시뮬레이션할 수 있다.31

  3. Edge AI 및 이상 징후 탐지: ML 추론을 클라우드가 아닌 ’생산 라인 장치(Edge)’에서 직접 실행하여 33, 이미지 인식 등을 통해 ’실시간’으로 ’미세 결함(micro-defects)’을 탐지한다.31

이 사례에서 ’디지털 트윈’은 피지컬 AI를 위한 ‘반사실적 추론(counterfactual reasoning)’ 시뮬레이터로 작동한다. (1) 예측 정비 32는 “이런 진동 패턴은 고장과 상관있다“는 1단계(상관관계)에 기반한다. (2) Edge AI의 실시간 결함 탐지 33는 “결함을 감지하고 라인을 중지시킨다“는 2단계(행동)에 가깝다. (3) 하지만 ‘디지털 트윈’ 31은 한 차원 높다. 엔지니어가 “만약 우리가 공정 A의 온도를 5도 높였다면, 생산 수율은 어떻게 되었을까?“라고 묻는 것 31은, ’실제로 일어나지 않은 일’의 결과를 예측하는 3단계 ’반사실적 추론’과 정확히 일치한다. 즉, 디지털 트윈은 ’가상 개입’을 통해 최적의 정책을 찾도록 돕는 핵심적인 인과 모델이다.

4. ’왜?’라는 질문 - 인과 추론(Causal Inference)의 원리와 응용

앞서 논의된 지식 표현(온톨로지)과 행동형 AI(피지컬 AI)를 궁극적으로 뒷받침하는 이론은 ’인과 추론’이다. AI가 ‘왜’ 그런 결과가 나왔는지 이해해야만 진정한 강인성을 확보할 수 있다.

4.1 인과성의 사다리: 상관관계는 인과관계가 아니다

컴퓨터 과학자 유디아 펄(Judea Pearl)은 그의 저서 ‘The Book of Why’ 35에서, 통계학이 오랫동안 ’인과관계’를 ’완벽한 상관관계’로 오해했다고 비판하며 36, 인과성을 이해하는 3단계의 ’사다리(Ladder of Causation)’를 제시했다.36

현대의 많은 머신러닝(특히 딥러닝) 모델은 이 ‘인과성의 사다리’ 1단계(Seeing)에 머물러 있다. 이 모델들은 대규모 데이터 1에서 XY 사이의 복잡한 ‘상관관계’ 또는 ‘연관성’ 1을 학습하여 P(Y|X)를 정교하게 근사한다. 하지만 “왜” XY와 연관되는지, 그 기저의 ‘본질적인 인과 구조(intrinsic causal relationships)’ 1를 이해하지 못한다. 이것이 훈련 데이터의 분포가 조금만 바뀌어도(예: 엣지 케이스) 모델이 쉽게 실패하고, ‘강인하지(robust)’ 못하며 ’일반화’에 실패하는 근본적인 원인이다.

[표 1: 인과성의 사다리 3단계 비교] 36

층 (Rung)명칭 (Name)핵심 질문 (Key Question)형식 표기 (Notation)예시 (Example)
1단계 (L1)보는 것 (Seeing) / 연관“만약 ~을 본다면, ~은 어떠한가?” (연관성)$P(YX)$ (조건부 확률)
2단계 (L2)하는 것 (Doing) / 개입“만약 ~을 ‘한다면’, ~은 어떻게 되는가?” (인과성)$P(Ydo(X))$ (do-연산자)
3단계 (L3)상상하는 것 (Imagining) / 반사실“만약 ~을 ‘하지 않았더라면’, ~은 어떻게 되었을까?”$P(Y_xX=x’, Y=y’)$ (반사실적)

1단계와 2단계의 근본적인 차이는 P(Y|X)P(Y|do(X))의 구분이다.36

  • P(Y|X) (Rung 1, 관찰): “기압계가 낮은 것을 보니(X), 폭풍이 올(Y) 확률“은 높다. 이는 기압계와 폭풍 모두 ’저기압’이라는 공통 원인(confounder)을 갖기 때문이다.

  • P(Y|do(X)) (Rung 2, 개입): “내가 기압계를 강제로 낮춘다면(do(X)), 폭풍이 올(Y) 확률“은 변하지 않는다 (0이다). do-연산자는 이 ’개입’을 통해 X로 들어오는 모든 인과적 화살표(예: 저기압 \rightarrow 기압계)를 ‘끊어버리고’ X의 값을 강제로 설정하는 것을 의미한다.

4.2 인과 추론의 실제 적용: ’개입’의 효과 측정하기

[응용 1] 의학: RCT의 한계와 실제 임상 근거 (Real-World Evidence, RWE)

신약의 ‘인과적’ 효과를 검증하는 ’골드 스탠더드’는 **무작위 대조 시험(Randomized Controlled Trial, RCT)**이다.18

  • RCT의 원리: 환자를 ’무작위(randomization)’로 치료군/대조군에 배정함으로써 40, 우리가 알거나 혹은 모르는 모든 ‘교란 변수(confounders)’(예: 나이, 질병 심각도, 생활 습관)의 영향을 두 그룹 간에 평균적으로 동일하게 만든다.40 따라서 두 그룹 간의 결과 차이는 오직 ’약물 개입’에 의한 ’인과적 효과’라고 결론 내릴 수 있다.41

  • 한계: RCT는 윤리적 문제(특정 환자에게 위약을 배정하는 문제), 막대한 비용과 시간, 그리고 매우 통제된 환경에서 진행되어 실제 현실42을 반영하지 못할 수 있다는 한계로 인해 항상 실행 가능한 것은 아니다.18

  • 해결책 (인과 추론): RCT를 수행할 수 없을 때, 이미 수집된 ‘관찰 데이터’(예: 병원 EMR 데이터) 38 또는 ‘실제 임상 근거(RWE)’ 38를 사용해 RCT와 유사한 ’인과적 효과’를 추론한다.

  • 주요 방법론 (IPTW): 대표적인 방법론은 ‘역확률 가중치 부여(IPTW, Inverse Probability Treatment Weighting)’ 38이다. (1) 관찰 데이터에서 ‘누가 왜 치료를 받았는지’(예: “더 아픈 사람이 신약을 받았다”)에 대한 경향성 점수(Propensity Score) 모델을 만든다. (2) 이 점수를 이용해 데이터에 ’가중치’를 부여한다. 즉, 신약을 받은 사람 중 ‘받을 확률이 낮았던 사람’(상대적으로 건강했던 사람)에게 높은 가중치를 준다. (3) 이 ‘가중치가 적용된’ 데이터셋은 마치 치료가 ’무작위’로 할당된 것처럼 교란 변수들이 통계적으로 균형을 이루게 된다.

인과 추론 방법론(IPTW 등)은 우리가 가진 1단계(관찰) 데이터 [43 P(L|D)]를 통계적으로 ’재구성’하여, 2단계(개입) 질문 [43 P(L|do(D))]에 답하려는 시도이다. 이는 RCT의 ’물리적 개입(무작위 배정)’을 ’통계적 개입’으로 흉내 내는 것이며, RWE 42의 풍부한 대표성과 RCT 40의 인과적 추론 능력을 결합하려는 노력이다.

[응용 2] 경제학: 정책 효과 분석과 ‘자연 실험(Natural Experiment)’

경제 정책(예: 최저 임금 인상)의 효과를 RCT로 검증하는 것은 사실상 불가능하다.44 2021년 노벨 경제학상은 ’자연 실험(Natural Experiment)’을 통해 이 문제를 해결한 공로를 인정했다.44

  • 해결책 (자연 실험): ’자연 실험’은 정책이나 제도의 변화가 마치 ’무작위 배정’처럼 작동하는 “as if” 무작위 상황을 찾는 것이다.44

  • 사례 (Card & Krueger): ’최저 임금 인상’의 고용 효과 분석.44

  • 개입 (Treatment): 1992년 미국 뉴저지(NJ) 주가 최저 임금을 인상 (치료군).

  • 통제 (Control): 인접한 펜실베이니아(PA) 주는 인상하지 않음 (대조군).

  • 논리: NJ와 PA의 경계에 있는 패스트푸드점들은 지리적, 경제적으로 매우 유사하므로, ’주 경계선’이라는 ‘자연적’ 구분이 ’무작위 배정’과 유사하게 작동한다고 가정한 것이다.44

  • 결과: 전통 경제학의 예측(최저 임금 인상 시 고용 감소)과 달리, NJ의 고용이 감소하지 않음을 보였다.44

  • 핵심: ’자연 실험’은 현실 세계에서 ’do-연산자’가 작동한 순간(NJ의 정책 변경)을 포착하여, ’관찰 데이터’에서 ’인과적 효과’를 추출하는 ‘설계 기반(design-based)’ 접근법이다.45 이는 데이터를 정교한 통계 모델(Rung 1)에 넣는 것이 아니라, ‘어떻게 데이터가 생성되었는지’ 그 ’설계’를 이해하고 45, ’개입’이 ‘as if’ 무작위인 44 순간을 찾아내는 것이다.

[응용 3] 마케팅: 업리프트 모델링 (Uplift Modeling)

마케팅 캠페인(예: 쿠폰 발송)의 ROI를 극대화하는 것은 전형적인 인과 추론 문제이다.

  • 1단계 (상관관계) 접근: P(구매|쿠폰)이 높은 고객(예: VIP 고객)에게 쿠폰을 보낸다.

  • 문제점: 이 고객들 중에는 ‘쿠폰 없이도 어차피 살 사람(Sure Things)’ 46이 대거 포함되어 있다. 이들에게 쿠폰을 보내는 것은 ’비용 낭비’이며, ROI를 갉아먹는다.

  • 2단계 (인과 추론) 접근: ‘업리프트 모델링(Uplift Modeling)’ 46을 사용한다.

  • 목표: ’쿠폰’이라는 ’개입(treatment)’이 구매 행동에 미치는 ’순수한 인과적 효과(Uplift)’가 가장 큰 사람들을 찾아낸다.48

  • 측정 공식: Uplift = P(구매 | do(쿠폰)) - P(구매 | do(쿠폰 없음))

  • 고객 분류 46:

  1. Persuadables (설득 가능자): Uplift > 0. (쿠폰을 줘야만 구매. 마케팅의 유일한 타겟)

  2. Sure Things (확실한 구매자): Uplift \approx 0. (쿠폰과 상관없이 어차피 구매)

  3. Lost Causes (가망 없는 고객): Uplift \approx 0. (쿠폰과 상관없이 어차피 안 삼)

  4. Sleeping Dogs (잠자는 개): Uplift < 0. (쿠폰을 주면 오히려 구매 안 함. 예: 스팸으로 인식)

업리프트 모델링은 마케팅의 질문을 ’누가 살 것인가?(예측)’에서 ’누구를 사게 만들 수 있는가?(인과)’로 전환한다. 전통적인 마케팅 46은 ‘구매 확률’(Rung 1)을 예측한다. 업리프트 모델링 46은 ‘구매 확률의 차이’(Rung 2)를 예측한다.46 ’Sure Things’에게 쿠폰을 보내는 것은 Uplift가 0인데 비용(쿠폰 값)만 발생시켜 ROI가 ’음수’가 된다. 인과 추론 47을 통해 ‘Persuadables’ 46 그룹만을 정확히 타겟팅해야만, 마케팅 캠페인의 ‘진짜’ 인과적 효과 46를 극대화하고 ROI를 ’양수’로 만들 수 있다.

5. 종합적 통찰 - 지식과 인과, 그리고 행동의 융합

1, 2, 3부에서 다룬 온톨로지(지식), 피지컬 AI(행동), 인과 추론(이해)은 이제 서로 융합되어 차세대 AI 시스템을 구축하고 있다.

5.1 온톨로지 기반 인과 발견 (Ontology-Guided Causal Discovery)

순수하게 ’관찰 데이터’로부터 인과 구조(Causal DAG49)를 발견(Causal Discovery)하려는 시도는, 가능한 그래프의 ’탐색 공간(search space)’이 너무 방대하고 49 데이터가 희소(sparse)하기 때문에 매우 어렵다.

이 문제의 해결책은 ’지식 주입(Knowledge-Infused)’이다. 온톨로지(Ontology) 또는 지식 그래프(KG)를 ’사전 지식(Prior Knowledge)’으로 활용하여 탐색 공간을 ’제약(constrain)’한다.50 온톨로지의 ‘방향성 있는 그래프 구조’(예: is-a, part-of)를 인과 탐색을 위한 ’구조적 제약(structural constraints)’으로 사용하는 것이다.51

예를 들어, 생물학적 인과 관계를 탐색할 때 52, GO 온톨로지 7가 (A는 B의 하위 프로세스이다)라고 정의한다면, 인과 탐색 알고리즘은 (B \rightarrow A)라는 방향의 인과 관계(B가 A의 원인이 됨)는 가정하지 않도록 제약할 수 있다. 이는 인과 탐색 알고리즘이 고려해야 할 엣지(간선)의 수를 극적으로 줄여, 계산 효율성과 정확도를 높인다.51 최근에는 LLM 49과 KG 53를 결합하여, LLM이 변수 간의 의미론적 관계 54를 이해하여 ’인과적 사전 지식(causal priors)’을 생성하고, KG가 이 지식을 구조화하여 통계적 모델에 주입하는 54 연구가 활발하다.

이는 온톨로지/KG가 순수 데이터 기반 인과 탐색의 ’과적합(spurious correlation)’을 방지하는 ‘의미론적 정규화(Semantic Regularization)’ 장치로 작동함을 의미한다. 순수 통계적 인과 탐색 55은 데이터의 ’우연한 상관관계’를 ’인과관계’로 오인할 위험이 크다.1 온톨로지 51는 수십, 수백 년간 축적된 인간의 ‘도메인 지식’ 56을 공식화한 것이다. 이 ’도메인 지식’을 ‘사전 지식’ 50으로 주입함으로써, 알고리즘이 “데이터상으로는 A와 B가 강하게 연관되어 보일지라도, 온톨로지(도메인 지식)에 따르면 이 관계는 인과적으로 불가능(implausible)하다“고 판단하게 만든다. 이는 뉴로-심볼릭 AI(Neuro-Symbolic AI) 58의 핵심 철학과도 일치한다.

5.2 피지컬 AI와 인과 학습: ’행동’을 통한 원인 습득

피지컬 AI(로봇 등)가 ’의미 있는 물리적 상호작용’을 하려면 59, ‘상관관계’(예: “바닥에 물이 있으면 미끄럽다”)를 넘어 ‘인과관계’(예: “내가 물을 쏟으면 바닥이 미끄러워진다”)를 이해해야 한다.

피지컬 AI는 ’수동적 관찰자(passive observer)’가 아니라 ‘적극적인 행동 주체(active agent)’ 61이기 때문에, ’행동’을 통해 ’개입(intervention)’을 수행할 수 있다.62 로봇이 ‘물체를 밀어보는’ 행위 62는, do(push_object)라는 ’개입’을 수행하여 ‘환경의 인과 모델’(forward/inverse model 63)을 ’적극적으로 학습(active learning)’하는 과정이다.64

이는 ‘기반이 된 인과 이론(Grounded Theory of Causation)’ 62의 필요성으로 이어진다. 전통적인 인과 추론에서 인간 과학자 62는 ‘인과 변수’(예: ‘약물’)와 ‘개입’(예: ‘투약’)이 무엇인지 미리 알고 시작한다.62 하지만 로봇은 ’픽셀(raw sensor data)’만 볼 뿐이다. 로봇은 ’저 빨간 블록’이 독립된 ’변수’인지, ’내 팔을 뻗는 행위’가 ’개입’인지조차 스스로 배워야 한다.62 따라서 로봇을 위한 인과 이론은, ’인과성’이라는 추상적 개념 자체를 ’물리적 상호작용 경험’에 ’기반(grounded)’시켜야 한다.62 로봇은 수많은 ‘행동 정책(policies)’ 62을 시도해보고, 그중 어떤 행동이 ‘외과적 개입(surgical intervention)’ 62처럼 작동하여 환경의 특정 ’변수’만을 독립적으로 변화시키는지 ’발견’해야 한다.

결론적으로, 피지컬 AI는 ‘인과성의 사다리’ 1단계(관찰)에 갇힌 정보 AI와 달리, 2단계(개입)를 스스로 수행하며 ’인과 모델’을 ‘바닥부터(from scratch)’ 구축할 수 있는 잠재력을 가진다. LLM과 같은 정보 AI는 방대한 텍스트(1단계 관찰 데이터) 1를 학습하여 ’A가 B의 원인이다’라는 텍스트는 학습할 수 있지만, 그 진위를 ’검증’할 방법이 없다. 반면 피지컬 AI 62는 ’A가 B의 원인이다’라는 가설이 생기면, 즉시 do(A)라는 ‘물리적 실험’ 63을 수행하고 그 결과를 ‘관찰’ 67함으로써 가설을 ’검증’하거나 ’반증’할 수 있다. 이 ‘실험-검증’ 루프 61는 피지컬 AI가 ‘허위 상관관계’ 1를 스스로 제거하고, ‘직관적 물리’ 63를 포함한 ‘세상의 인과 모델(world model)’ 59을 구축하게 만든다.

6. 결론: 인과관계를 이해하는 AI를 향한 로드맵

본 보고서는 상관관계 기반의 패턴 매칭을 넘어, ’이해’에 기반한 차세대 AI를 구축하기 위한 세 가지 핵심 축(지식, 행동, 원인)과 그 구체적인 적용 사례를 분석했다.

  1. 지식의 공식화 (온톨로지/KG): GO 7, Google 14, Amazon 18, LinkedIn 22 사례에서 보았듯이, 지식을 명시적으로 ’구조화’하는 것은 ’의미 기반 검색’과 ’정확한 추론’의 전제 조건이다. 특히 Amazon의 AutoKnow 18와 LinkedIn의 LKG 22 사례는 ’지식 그래프’가 ’기계 학습’과 결합하여 ‘자동으로’ 구축되고 ‘동적으로’ 추론하는 강력한 시너지를 보여주었다.

  2. 세계와의 상호작용 (피지컬 AI): Dex-Net 27, 자율주행 29, 스마트 팩토리 31 사례는 AI가 ’물리적 세계’의 ’엣지 케이스’와 ’낯선 상황’에 대응하기 위해 진화하는 방식을 보여주었다. ‘도메인 무작위화’ 27와 ‘디지털 트윈’ 31은 각각 시뮬레이션(가상)과 현실(물리)의 격차를 해소하는 핵심 인과 전략이다.

  3. 인과 추론 (Causal Inference): Judea Pearl의 ‘인과성의 사다리’ 36는 ’보는 것(1단계)’과 ’하는 것(2단계)’의 근본적 차이를 명확히 했다. 의학 18, 경제학 44, 마케팅 46 사례는, 우리가 2단계 ’개입’의 효과를 측정하기 위해 1단계 ’관찰 데이터’를 어떻게 창의적으로 활용하는지(예: IPTW, 자연 실험, 업리프트 모델링) 보여주었다.

미래의 AI는 이 세 가지가 융합된 형태가 될 것이다. (지식 + 인과)의 융합은 ‘온톨로지 기반 인과 발견’ 51으로 나타나며, 이는 인간의 ‘도메인 지식’(Symbolic)을 활용하여 ‘데이터 기반’(Neural) 인과 탐색의 한계를 극복한다.69 (행동 + 인과)의 융합은 ‘피지컬 AI’ 62로 나타나며, ’행동’을 ‘개입’ 63으로 사용하여 ’관찰’만으로는 불가능했던 ‘세상의 인과 모델’ 59을 스스로 ’학습’하고 ’검증’한다.

이 세 축의 융합은 범용인공지능(AGI) 71을 향한 핵심 로드맵이다. 지식으로 ’가설’을 세우고, 행동으로 ’실험’하며, 인과로 ’이해’하는 AI만이 우리가 신뢰할 수 있는 강인하고(robust) 설명 가능한(explainable) 파트너가 될 것이다.

7. Works cited

  1. Causal Inference Meets Deep Learning: A Comprehensive Survey - PMC - NIH, accessed November 7, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC11384545/
  2. OWL - Semantic Web Standards - W3C, accessed November 7, 2025, https://www.w3.org/OWL/
  3. OWL 2 Web Ontology Language Primer (Second Edition) - W3C, accessed November 7, 2025, https://www.w3.org/TR/owl2-primer/
  4. OWL 2 Web Ontology Language Document Overview (Second Edition) - W3C, accessed November 7, 2025, https://www.w3.org/TR/owl2-overview/
  5. Semantic Web - Wikipedia, accessed November 7, 2025, https://en.wikipedia.org/wiki/Semantic_Web
  6. OWL Web Ontology Language Overview - Stanford University, accessed November 7, 2025, http://www.ksl.stanford.edu/people/dlm/webont/OWLOverviewMay12003.htm
  7. About the GO - Gene Ontology, accessed November 7, 2025, https://geneontology.org/docs/introduction-to-go
  8. Gene Ontology Resource, accessed November 7, 2025, https://geneontology.org/
  9. Download annotations - Gene Ontology, accessed November 7, 2025, https://geneontology.org/docs/download-go-annotations/
  10. GO enrichment analysis - Gene Ontology, accessed November 7, 2025, https://geneontology.org/docs/go-enrichment-analysis/
  11. Case Study Articles - Enterprise Knowledge, accessed November 7, 2025, https://enterprise-knowledge.com/article-type/case-study/
  12. The enterprise ontology for Knowledge Engineering Review - IBM Research, accessed November 7, 2025, https://research.ibm.com/publications/the-enterprise-ontology
  13. Enterprise Knowledge Graph walkthrough | Google Cloud Blog, accessed November 7, 2025, https://cloud.google.com/blog/products/ai-machine-learning/enterprise-knowledge-graph-walkthrough
  14. Google’s Knowledge Graph and Knowledge Panels - The Keyword, accessed November 7, 2025, https://blog.google/products/search/about-knowledge-graph-and-knowledge-panels/
  15. Introducing the Knowledge Graph: things, not strings - The Keyword, accessed November 7, 2025, https://blog.google/products/search/introducing-knowledge-graph-things-not/
  16. How Google’s Knowledge Graph works, accessed November 7, 2025, https://support.google.com/knowledgepanel/answer/9787176?hl=en
  17. Using graph neural networks to recommend related products …, accessed November 7, 2025, https://www.amazon.science/blog/using-graph-neural-networks-to-recommend-related-products
  18. Building product graphs automatically - Amazon Science, accessed November 7, 2025, https://www.amazon.science/blog/building-product-graphs-automatically
  19. LinkedIn Knowledge Graph - GM-RKB, accessed November 7, 2025, http://www.gabormelli.com/RKB/LinkedIn_Knowledge_Graph
  20. How LinkedIn Scales Its Analytical Data Platform - Acceldata, accessed November 7, 2025, https://www.acceldata.io/blog/data-engineering-best-practices-linkedin
  21. Knowledge Graphs explained: How you turn data into valuable insights - Spread AI, accessed November 7, 2025, https://www.spread.ai/resources/stories/knowledge-graphs-explained-how-data-becomes-valuable-insights
  22. LinkedIn Knowledge Graph – KDnuggets Interview - KDnuggets, accessed November 7, 2025, https://www.kdnuggets.com/2016/10/interview-creators-linkedin-knowledge-graph.html
  23. What is Embodied AI? | NVIDIA Glossary, accessed November 7, 2025, https://www.nvidia.com/en-us/glossary/embodied-ai/
  24. What Is Embodied AI? - Artificial Intelligence - Built In, accessed November 7, 2025, https://builtin.com/artificial-intelligence/embodied-ai
  25. Gemini Robotics 1.5 brings AI agents into the physical world - Google DeepMind, accessed November 7, 2025, https://deepmind.google/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world/
  26. Efficient Policy Learning for Robust Robot Grasping - Berkeley EECS, accessed November 7, 2025, https://www2.eecs.berkeley.edu/Pubs/TechRpts/2018/EECS-2018-120.pdf
  27. Dex-Net by BerkeleyAutomation, accessed November 7, 2025, https://berkeleyautomation.github.io/dex-net/
  28. Grasping machine learning and cloud robotics with Ken Goldberg - Autodesk, accessed November 7, 2025, https://www.autodesk.com/design-make/articles/ken-goldberg
  29. A Framework for Automated Driving System Testable … - NHTSA, accessed November 7, 2025, https://www.nhtsa.gov/sites/nhtsa.gov/files/documents/13882-automateddrivingsystems_092618_v1a_tag.pdf
  30. Report to Congress: Automated Vehicles - NHTSA, accessed November 7, 2025, https://www.nhtsa.gov/sites/nhtsa.gov/files/2023-06/Automated-Vehicles-Report-to-Congress-06302023.pdf
  31. AI-Driven Smart Factory Optimization: How Siemens Transformed …, accessed November 7, 2025, https://millennial.ae/ai-driven-smart-factory-optimization-how-siemens-transformed-industrial-efficiency-with-predictive-analytics-and-edge-ai/
  32. AI-based predictive maintenance - Siemens Global, accessed November 7, 2025, https://www.siemens.com/global/en/products/automation/topic-areas/industrial-ai/usecases/ai-based-predictive-maintenance.html
  33. Anomaly Detection - Siemens Global, accessed November 7, 2025, https://www.siemens.com/global/en/products/software/simatic-apps/anomaly-detection.html
  34. Early identification and economic assessment of process anomalies with AI-based app, accessed November 7, 2025, https://press.siemens.com/global/en/pressrelease/early-identification-and-economic-assessment-process-anomalies-ai-based-app
  35. The Book of Why - Wikipedia, accessed November 7, 2025, https://en.wikipedia.org/wiki/The_Book_of_Why
  36. Book Summary: The Book of Why by Judea Pearl and Dana …, accessed November 7, 2025, https://www.tosummarise.com/book-summary-the-book-of-why-by-judea-pearl-and-dana-mckenzie/
  37. Mini-review: The Book of Why - LessWrong, accessed November 7, 2025, https://www.lesswrong.com/posts/xiC9HnYj7YQDYRYyk/mini-review-the-book-of-why
  38. How Causal Inference is Transforming Real-World Observational Prospective Trials, accessed November 7, 2025, https://www.quanticate.com/blog/causal-inference
  39. OBSERVATIONAL STUDIES VS. RANDOMIZED CONTROLLED …, accessed November 7, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC3293157/
  40. Strengthening causal inference from randomised controlled trials of complex interventions, accessed November 7, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC9189821/
  41. Causal inference in economics and marketing - PNAS, accessed November 7, 2025, https://www.pnas.org/doi/10.1073/pnas.1510479113
  42. Causal Inference Methods for Combining Randomized Trials and Observational Studies: A Review - Project Euclid, accessed November 7, 2025, https://projecteuclid.org/journals/statistical-science/volume-39/issue-1/Causal-Inference-Methods-for-Combining-Randomized-Trials-and-Observational-Studies/10.1214/23-STS889.full
  43. Causality in Medicine: Moving Beyond Correlation in Clinical Practice - Mayo Clinic Platform, accessed November 7, 2025, https://www.mayoclinicplatform.org/2021/07/23/causality-in-medicine-moving-beyond-correlation-in-clinical-practice/
  44. answering causal questions using observational data - Nobel Prize, accessed November 7, 2025, https://www.nobelprize.org/uploads/2021/10/advanced-economicsciencesprize2021.pdf
  45. Causal Inference: A Guide for Policymakers - Simons Institute, accessed November 7, 2025, https://simons.berkeley.edu/news/causal-inference-guide-policymakers
  46. Uplift Modeling: Advanced Customer Targeting with Causal Machine …, accessed November 7, 2025, https://ai.gopubby.com/uplift-modeling-advanced-customer-targeting-with-causal-machine-learning-985497065e78
  47. Causal Inference Part 6: Uplift Modeling: A Powerful Tool for Causal Inference in Data Science - Rudrendu Paul, accessed November 7, 2025, https://rudrendupaul.medium.com/causal-inference-part-6-uplift-modeling-a-powerful-tool-for-causal-inference-in-data-science-9c5c23377550
  48. Uplift Modeling: From Causal Inference to Personalization - CIKM 2023 Tutorial - YouTube, accessed November 7, 2025, https://www.youtube.com/watch?v=OkWTEF3icFA
  49. [2311.11689] Causal Structure Learning Supervised by Large Language Model - arXiv, accessed November 7, 2025, https://arxiv.org/abs/2311.11689
  50. CausalDisco: Causal discovery using knowledge graph link prediction - arXiv, accessed November 7, 2025, https://arxiv.org/html/2405.02327v1
  51. Concept Paper for a Digital Expert: Systematic Derivation of (Causal …, accessed November 7, 2025, https://www.mdpi.com/2504-4990/6/2/42
  52. The Representation of Causality and Causation with Ontologies: A Systematic Literature Review - PubMed Central, accessed November 7, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC9473331/
  53. [2506.08771] Paths to Causality: Finding Informative Subgraphs Within Knowledge Graphs for Knowledge-Based Causal Discovery - arXiv, accessed November 7, 2025, https://arxiv.org/abs/2506.08771
  54. TimeMKG: Knowledge-Infused Causal Reasoning for Multivariate Time Series Modeling, accessed November 7, 2025, https://arxiv.org/html/2508.09630v2
  55. Deep causal learning for robotic intelligence - PMC - NIH, accessed November 7, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC9992986/
  56. A Structural Causal Model Ontology Approach for Knowledge Discovery in Educational Admission Databases - MDPI, accessed November 7, 2025, https://www.mdpi.com/2673-9585/5/3/15
  57. Towards Interactive Causal Relation Discovery Driven by an Ontology - The Association for the Advancement of Artificial Intelligence, accessed November 7, 2025, https://cdn.aaai.org/ocs/18237/18237-78856-1-PB.pdf
  58. Workshop on Causal Neuro-Symbolic Artificial Intelligence - YouTube, accessed November 7, 2025, https://www.youtube.com/watch?v=6mGa2xx6u6A
  59. The Essential Role of Causality in Foundation World Models for Embodied AI - arXiv, accessed November 7, 2025, https://arxiv.org/html/2402.06665v1
  60. The Essential Role of Causality in Foundation World Models for Embodied AI - arXiv, accessed November 7, 2025, https://arxiv.org/html/2402.06665v2
  61. [2301.03886] From Continual Learning to Causal Discovery in Robotics - arXiv, accessed November 7, 2025, https://arxiv.org/abs/2301.03886
  62. Towards a Grounded Theory of Causation for … - OpenReview, accessed November 7, 2025, https://openreview.net/pdf?id=K9PI5ewchUY
  63. Learning Low-Level Causal Relations using a Simulated Robotic Arm - arXiv, accessed November 7, 2025, https://arxiv.org/html/2410.07751v1
  64. [2410.20894] Active Causal Structure Learning with Latent Variables: Towards Learning to Detour in Autonomous Robots - arXiv, accessed November 7, 2025, https://arxiv.org/abs/2410.20894
  65. Is Reinforcement Learning just a special case of causal modeling? - Reddit, accessed November 7, 2025, https://www.reddit.com/r/reinforcementlearning/comments/rx5jrp/is_reinforcement_learning_just_a_special_case_of/
  66. Causality-enhanced Decision-Making for Autonomous Mobile Robots in Dynamic Environments - arXiv, accessed November 7, 2025, https://arxiv.org/html/2504.11901v3
  67. [2507.22380] Improving Generalization Ability of Robotic Imitation Learning by Resolving Causal Confusion in Observations - arXiv, accessed November 7, 2025, https://arxiv.org/abs/2507.22380
  68. From Continual Learning to Causal Discovery in Robotics, accessed November 7, 2025, https://proceedings.mlr.press/v208/castri23a/castri23a.pdf
  69. Neuro-Symbolic AI: Combining Logic and Learning for Better Decisions | QodeQuay, accessed November 7, 2025, https://www.qodequay.com/neuro-symbolic-ai-guide
  70. Causal Neuro-Symbolic AI for Root Cause Analysis in Smart Manufacturing - Scholar Commons, accessed November 7, 2025, https://scholarcommons.sc.edu/cgi/viewcontent.cgi?article=1633&context=aii_fac_pub
  71. Embodied Intelligence: The Key to Unblocking Generalized Artificial Intelligence - arXiv, accessed November 7, 2025, https://arxiv.org/html/2505.06897v1